FILTER MODE ACTIVE

#защита от атак

Найдено записей: 1

#защита от атак02.08.2025

MIT представил метод стабильного обучения трансформеров с помощью липшицевых ограничений и оптимизатора Muon

Исследователи MIT разработали метод стабильного обучения больших трансформеров через липшицевы ограничения и спектральную регуляцию весов с оптимизатором Muon, исключая необходимость нормализаций.